import os

import jieba



text = "为什么女人更爱喝咖啡而男人更爱喝酒呢据研究表明在一般社交场合女人更喜欢咖啡而男人更喜欢喝酒在19世纪的德国咖啡曾被讽刺为女人的饮料在他们看来女人的喋喋不休女人的自作主张似乎都跟咖啡有着千丝万缕的关系虽然可爱但不能成为常态在女人看来咖啡是浪漫是情调而在男人眼里咖啡的功能仅限于提神醒脑而在社交场合男人更愿意以酒示人在他们眼里酒代表了豪迈酒代表了阳刚之气咖啡的口感细腻润滑香甜而不腻在当今糕点跟水果似乎成了咖啡的标配这些都是女人的首选我们常喝的白咖啡中富含更多的蛋白质属优质蛋白质经由人体消化之后分解成人体必须的氨基酸再在水果中所含维生素C的辅助作用合成能便皮肤细腻、光滑、富有弹性的胶原蛋白" \
       "所以说白咖啡的美容养颜的功效也便体现在此吧这里说一下的吃胶原蛋白能起到美容养颜的作用是一种错误的说法所有的蛋白质吃进去都会经过消化分解再经人体重新合成要想做到美容养颜要多食用优质蛋白质胶原蛋白并非优质蛋白质而水果在其中起到必不可少的辅助作用这就是人们常说的多吃水果能美容的原因所在除了我们常喝的白咖啡黑咖啡也受女士所钟爱咖啡可以促进脂肪分解帮助燃脂在女士减重的过程中起到一定的辅助作用不过黑咖啡虽然对于减重有辅助作用但是人体一天所能接受的最在摄入量不得超过1500ml过量摄入咖啡会引起失眠焦虑烦燥咖啡中所含的生物碱过量会使我们的胃肠道受损这就是说咖啡也会醉茶也会醉酒是男人社交的必须品" \
       "在中国朋友聚会喝酒谈生意喝酒失意喝酒失恋喝酒等等酒成了男人生活里不可分割的一部分酒与中国文化密切相关我国古代诗人似乎都与酒有着密不可分的关系不得志喝酒比如李白的《将进酒》便是不得志时所作送别喝酒比如王维的劝君更进一杯酒西出阳关无故人愁闷喝酒比如曹操的何以解忧唯有杜康杜康是酒的发明人这里用杜康代指酒不过我倒认为忧从中来杜康何解再比如说李清照的三杯两盏淡酒怎敌他晚来风急李清照是我国古代著名的女词人那个时候咖啡才刚刚被发现还并未传到中国如果咖啡在古代出现便传到中国李清照的诗词里可能更多会出现咖啡也不一定哦酒也有一定的营养价值只不过白酒的营养价值有限黄酒、葡萄酒的营养价值还是比较高的" \
       "适当的饮酒对人体也是有好处的人体所能接受的量白酒一天摄入量不超过50ml啤酒不超过1瓶是为最好咖啡与酒并不冲突酒后喝一杯咖啡可以促进肝肾功能活跃从而使酒精转变成乙醛快速氧化分解成二氧化碳和水再经由肾脏排出体外男人爱喝酒女人爱喝咖啡咖啡可以解酒酒能解忧相辅相成共同发展"


class MyTokenizer:
    def __init__(self):
        self.word_dict = {}  # 词典
        self.build_dict(text)

    def build_dict(self, text=None):
        words = jieba.lcut(text)
        for word in words:
            if word not in self.word_dict:
                self.word_dict[word] = len(self.word_dict)  # 将词语映射到索引

    def encode(self, text):
        words = jieba.lcut(text)
        return [self.word_dict[word] for word in words if word in self.word_dict]

    def decode(self, encoded_text):
        # for word, idx in vocab.items():
        #     if idx == index:
        #         return word
        # return "<UNK>"  # 如果索引不存在于词汇表中，返回未知单词标记

        return [list(self.word_dict.keys())[idx] for idx in encoded_text]
